Nettoyage et Traitement des Données NASA

Introduction

Ce script Python permet de charger, nettoyer et traiter des données de lactation et météorologiques à l'aide de l'API NASA POWER.

Étapes du script

1. Bibliothèques Requises

Ce script nécessite les bibliothèques suivantes :

2. Chargement des Données

upload_df charge les données des fichiers fermes.txt et lactation_data.txt dans des DataFrames pandas. Elle renomme la colonne ferme en farm dans le DataFrame des fermes et définit les noms de colonnes pour le DataFrame des lactations.

3. Fusion des Données

Cette fonction fusionne les DataFrames des fermes et des lactations en utilisant la colonne farm comme index.

4. Calcul des Intervalles de Lactation

lactation_interval calcule la date de fin de lactation (date de mise bas +120 jours) pour chaque enregistrement et convertit les dates au format YYYYMMDD.

5. Création du Répertoire de Sortie

Cette fonction crée un répertoire pour stocker les fichiers de sortie JSON si celui-ci n'existe pas.

6. Récupération des Données Météorologiques NASA

Cette fonction interroge l'API NASA POWER pour récupérer des données météorologiques basées sur des coordonnées géographiques et une période donnée.

7. Traitement des Données NASA

Cette fonction traite les données météorologiques en associant chaque exploitation à ses données climatiques sur la période de lactation. Elle créé le tableau csv avec les données météorologiques correspondantes à chaque lactation.

8. Exécution du Script

L'exécution du script commence par le chargement des données, la fusion des DataFrames, le calcul des intervalles de lactation et enfin le traitement des données météorologiques.

Conclusion

Ce script permet une gestion automatisée des données de lactation et météorologiques en combinant diverses sources de données et en les nettoyant efficacement.